3.3 估计平均因果效应的双重稳健或增强IPW估计量

可忽略性 Z{Y(1),Y(0)}重合度 0<e(X)<1 下, 3.2 观察性实验中的倾向得分 给了 τ=E[Y(1)Y(0)] 的两个公式. 首先 (0.1)τ=E[μ1(X)]E[μ0(X)], 这里 μ1(X)=E[Y(1)|X]=E[Y|Z=1,X],μ0(X)=E[Y(0)|X]=E[Y|Z=0,X] 是实验/对照组下结果的条件期望.
其次是 IPW (0.2)τ=E[ZYe(X)]E[(1Z)Y1e(X)], 这里 e(X)=P(Z=1|X) 是倾向得分.

1 双重稳健估计量

1.1 总体版本

我们为结果 μ1(X,β1)μ0(X,β0) 的条件均值假定一个模型. 如果模型正确, 则 μ1(X,β1)=μ1(X), μ0(X,β0)=μ0(X). 我们假设一个倾向得分的模型 e(X,α), 如果正确则 e(X,α)=e(X). 实际中两个模型都有可能有错.
定义 μ~1dr=E[Z{Yμ1(X,β1)}e(X,α)+μ1(X,β1)],(1.1)μ~0dr=E[(1Z){Yμ0(X,β0)}1e(X,α)+μ0(X,β0)], 也可以写成 μ~1dr=E[ZYe(X,α)Ze(X,α)e(X,α)μ1(X,β1)],(1.2)μ~0dr=E[(1Z)Y1e(X,α)e(X,α)Z1e(X,α)μ0(X,β0)].
(1.1) 通过对残差进行逆倾向得分加权, 来加强回归估计量; (1.2) 通过引入填补结果 (imputed outcomes) 来增强 IPW 估计量. 因此, 双重稳健估计量也被称为 增强逆倾向得分加权估计量 (AIPW).
这个加强操作的理论作用如下:
{ #270}
aa 9
{ #23}
eaad

定理 1.1

假设可忽略性 Z{Y(1),Y(0)}|X 和重合度 0<e(X)<1.

  1. 如果 e(X,α)=e(X)μ1(X,β1)=μ1(X), 则 μ~1dr=E[Y(1)].
  2. 如果 e(X,α)=e(X)μ0(X,β0)=μ0(X), 则 μ~0dr=E[Y(0)].
  3. 如果 e(X,α)=e(X){μ1(X,β1)=μ1(X),μ0(X,β0)=μ0(X)}, 则 μ~1drμ~0dr=τ.

可见 μ~1drμ~0dr=τ 只需要倾向得分或者结果回归模型有一个对就行, 所以是双重稳健的!

1.2 样本版本

平均因果效应的双重稳定估计量

基于 (Xi,Zi,Yi)i=1n, 我们可以按如下步骤得到一个双重稳定的 τ 的估计量 [1]:

  1. 得到拟合的倾向得分 e(Xi,α^);
  2. 得到拟合的结果均值 μ1(Xi,β^1)μ0(Xi,β^0);
  3. 构造 τ^dr=μ^1drμ^0dr, 这里μ^1dr=1ni=1n[Zi{Yiμ1(Xi,β^1)}e(Xi,α^)+μ1(Xi,β^1)],μ^0dr=1ni=1n[(1Zi){Yiμ0(Xi,β^0)}1e(Xi,α^)+μ0(Xi,β^0)]

根据定义, 我们也可以改写为 τ^dr=τ^reg+1ni=1nZi{Yiμ1(Xi,β^1)}e(Xi,α^)1ni=1n(1Zi){Yiμ0(Xi,β^0)}1e(Xi,α^).(1.2) 对应, 我们也能写成 τ^dr=τ^ipw1ni=1nZie(Xi,α^)e(Xi,α^)μ1(Xi,β^1)+1ni=1ne(Xi,α^)Zi1e(Xi,α^)μ0(Xi,β^0).

2 双重稳健估计量的更多想法和理论

我们接下来提供两种直观的角度来理解 (1.1). 这里只关心 E[Y(1)] 的估计, 因为 E[Y(0)] 的是类似的.

2.1 减小 IPW 估计量的方差

μ1 的 IPW 估计量基于 μ1=E[ZYe(X)]. 它完全忽视了 Y 的结果模型. 虽然它可以不假设任何结果模型, 但是如果协变量对于结果有预测性, 则基于可行模型的残差, 通常比结果有一个更小的方差, 即使这个可行的模型是错的. 假设有一个可能错误的模型 μ1(X,β1), 有一个显然的分解 μ1=E[Y(1)]=E[Y(1)μ1(X,β1)]+E[μ1(X,β1)]. 如果在上式的第一项 Y(1)μ1(X,β1) 中用 IPW 作为实验处理的 "假的潜在结果", 我们能改写为 μ1=E[Z{Yμ1(X,β1)}e(X)]+E[μ1(X,β1)]=E[Z{Yμ1(X,β1)}e(X)+μ1(X,β1)], 这是成立的, 如果倾向得分模型正确 (无需假设结果模型正确).

2.2 减少结果回归模型的偏差

同样地我们看一个结果回归估计量 μ~1=E[μ1(X,β1)]. 它的偏差是 E[μ1(X,β1)Y(1)], 可以用 IPW 估计量 B=E[Z{μ1(X,β1)Y}e(X)] 来估计, 如果倾向得分模型正确. 所以去掉偏差的版本就是 μ~1B.

3 额外的说明

回顾 定理1.1的证明. 双重稳健的关键是这个乘积 μ~1drE[Y(1)]=E[e(X)e(X,α)e(X,α){μ1(X)μ1(X,β1)}]. 这一结构是"双重稳健"的, 但也可能是"双重脆弱"的. 如果两个模型都错误, 那乘积就会把错误放大.
不过总的来说, 双重稳健估计量一直是因果推断的标准策略.
最近也有人提出 双重机器学习 (DML), 来将 Logistic 回归、线性回归估计 e(X),μ(X) 替换掉.


  1. 之前我们不强调正确的模型中的参数, 所以可以简写 e^(Xi) 代替 e(Xi,α^), 以及 μ^z(Xi) 代替 μz(Xi,β^1). ↩︎